北京11期专题 | 偶数科技:打造新一代分析型数据库,更好的支持AI应用场景
The following article is from 拓扑社
微软加速器·北京11期项目专题
公司名称:北京偶数科技有限公司
一句话介绍:打造新一代数据仓库和AI,让企业更智能
项目关键词:新一代数据仓库、人工智能、 云数据库
上轮融资情况:A轮,2017年10月,红杉中国领投、红点中国跟投, 融资约5000万RMB
下轮融资意向:开放下一轮,B轮,2019年初启动
分析性数据库驱动精细化运营传统的数据库都是以Oracle、IBM、SAP为代表的交易型数据库,这类型数据库主要是针对基本的、日常的事务处理,例如,银行传统的手工记账便是典型的应用场景。
而进入大数据和人工智能时代,企业每天产生的数据量正呈爆炸式增长,面临海量的数据,传统数据库的IT架构和处理技术已经逐渐无法适应巨大的数据处理需求。
其次,企业对数据价值越来越重视,数据分析成为了十分重要的一环,但传统的交易型数据库难以实现大数据量、复杂性的数据分析需求,可扩展性也不足。这时候,企业亟待寻找新的解决方案,实现由数据驱动的精细化运营,其中分析型数据库已经成为近年的热点。
偶数科技成立于2016年,是一家专注于新一代分析型数据库的初创企业。2017年10月曾获得红杉资本中国、红点创投中国基金的数千万A轮融资。
创始人CEO常雷,2008年毕业于北京大学计算机系,曾任EMC高级研究员及EMC/Pivotal研发部总监,同时也是Apache HAWQ创始人,长期专注于大数据与云计算领域,对企业级数据管理有很深的理解。
新一代的数据库是一种分析型OLAP数据仓库系统,侧重企业决策支持,提供直观易懂的查询结果。
相对于传统的交易型数据库,分析型数据库具有以下优势:首先,分析型数据库支持复杂的分析操作,存储的数据时间跨度长,数量级的性能提升,解决了传统数据库不能交互式实时处理大数据的问题。
其次,分析数据库可以对数据进行在线统计、数据在线分析、实时查询等发掘信息数据价值的工作。第三,存储与计算分离的松散耦合架构,可以原生支持容器云平台,传统数据库的紧耦合架构不适合新型容器云平台。此外,分析型数据库能够更好的支持AI应用场景。
简单来说,分析型的数据库中的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据库以后,一般情况下将被长期保留,也就是数据库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
同时,分析型数据库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到当前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
“新一代的分析型数据仓库可扩展性的节点可以达到几千个,同时支持的应用场景也非常广泛,包括机器学习、传感器等收集到的数据都可以支持,这些是在传统数据库架构下是实现不了的。”
常雷也补充到,人工智能与分析型数据库是相辅相成的,人工智能离不开数据和算法,分析型数据仓库的基础架构,以及高可扩展性、实时性的优势,使其最贴近数据,具备与人工智能相结合的优势。
对于数据库本身来说,传统的数据库都是非自动化的数据处理,通过人工智能对数据库改造,会使数据库更智能,进而可以拓展更多应用场景,指导企业进行更有效的数据分析。
传统数据库向新型数据库转型,无论是对企业还是服务商来说,都存在一定的挑战,尤其是传统的数据库的架构是CPU模式,如果企业要想转向新一代高性能分析型数据库,需要把基础架构调整为利用CPU新指令以及新的硬件模式(包括GPU和FPGA等),调整前需要企业花去大量的时间重新编写代码,设计架构、调整代码。
SIMD性能提升一个数量级谈到数据库,肯定离不开Hadoop这种开源技术,同时Hadoop延伸出来很多数据仓库技术,例如Hive、Impala、Spark SQL、HAWQ等。
常雷提到,伴随着互联网公司的崛起,新一代数据仓库也随之兴起。总体来说,新一代的数据仓库可以分为三大类。第一大类:SQL on Hadoop。如Spark SQL、Hive、HAWQ、Presto,因为它的存储基本都在HDFS。第二类叫SQL on Object Store。
第三大类是从前面两类系统里发现一些缺陷后又演化出来的系统,称之为SQL on Hybrid Storage,有自己的原生存储,同时也支持HDFS和S3等其他存储,代表性系统包括HAWQ和Impala。
其中,HAWQ是Apache开源社区的孵化项目,很多大型企业都在使用并在开源社区为其贡献代码,而偶数科技正是依据这个系统进行产品布局的。
目前,偶数科技主要提供两款产品,开源版的Apache HAWQ和企业版的Oushu Database。据悉,Oushu Database是基于HAWQ打造的新一代数据仓库引擎,其优势在于采用了MPP和Hadoop结合的创新MPP++技术架构,高可扩展,遵循ANSI-SQL标准,具有极速执行器,提供PB级数据交互式查询能力。
同时,Oushu Database提供对主要BI工具的描述性分析支持和高级机器学习功能。兼容Oracle,Greenplum Database和PostgreSQL,可以轻松取代传统数据仓库和其他SQL-on-Hadoop引擎。
此外,Oushu Database支持原生Kubernetes容器平台,帮助企业无缝迁移到最新的云计算平台。
常雷解释道,将简单的无状态应用(比如Web服务器)迁移到容器比较简单,但将大数据平台迁移到容器却面临很多技术挑战。将Oushu Database和云平台结合带来应用和服务一体化,很容易做弹性扩容,自恢复和滚动升级,同时,Oushu Database在资源管理和自动化运维也带来很多便捷。
去年9月偶数科技发布了Oushu Database 3.0版本产品 。据悉,3.0版本对执行器进行了完全重新设计,充分利用了最新CPU的每一个特性,如SIMD指令等,可以做到性能的极致。其次,支持ORC外部存储格式,结合新的SIMD执行器,外部存储的性能可以提升10-50倍。
此外,传统数据仓库连接外部数据往往都是使用Connector形式,性能很慢,从而导致用户需要使用先导入外部数据再查询的方式,数据需要在多个系统存储多份,浪费了多倍存储空间。
结合新一代SIMD执行器,新版本可插拔存储框架使得数据库可以直接高性能访问外部数据,查询外部数据的性能和查询内部数据类似。
目前,Oushu Database已经在政府、金融、电信、电力、军工、制造业、物联网、互联网等行业广泛应用,助力政府机构与大型企业构建了全新的大数据平台。
比如,银行内各业务的数据孤岛效应严重、以及外部非结构化数据的整合不力等。金融行业需要高性能的数据仓库支持,Oushu Database可支持结构化数据的处理和非结构化数据的整合能力,可有效满足反欺诈等场景的数据处理。
在盈利模式上,偶数科技的产品是根据CPU/节点/容量收取账号年费,客单价在数十万到数百万之间不等。
而获客方面比较灵活,有从开源社区对接过来的客户,也有与微软进行战略合作,共同切入某垂直领域,还有直销团队。企业版客户已经达到数十家,代表性用户有国家电网、中兴、深圳市国税等。
偶数科技 x 微软加速器偶数科技是微软加速器·北京第11期的创新企业,专注于人工智能和新一代数据仓库。
偶数科技副总经理蓝洲在微软加速器·北京11期欢迎会演讲
进入微软加速器后,微软在技术方案和产品上为偶数科技提供支持。基于微软Azure云平台,偶数科技成功开发了Oushu云数据仓库服务。
在业务方面,微软加速器为偶数科技输送优质的客户资源,目前微软加速器已经为偶数科技对接了霍尼韦尔、太平保险集团以及兴业银行等大型客户。
微软加速器为偶数科技提供了品牌宣传、市场活动等资源,争取到了和IT桔子、品途商业评论等多家媒体联合报道的机会。市场活动方面,偶数科技创始人常雷作为校友代表,参加了由微软加速器举办的第4期校友参访活动,获得了和很多往期明星校友创始人、投资机构、大客户、媒体深度交流的机会。
偶数科技创始人常雷在微软加速器第4期校友参访活动中发言交流
另外,为了提高校友企业高管的管理能力,微软加速器为偶数科技提供了KPMG股权激励和财税培训、融资培训、专利战略培训等。
未来,微软加速器会继续为偶数科技提供品牌宣传、媒体采访、市场活动、融资对接等资源,还会牵线搭桥,与众多校友建立生态联系,互通有无。
偶数科技关注方式微信:偶数科技(OushuTech)点击“阅读原文”了解偶数科技微软加速器·北京×拓扑社
本文是拓扑社对微软加速器·北京第11期入选项目的专题报道。
IT桔子是微软加速器6期校友企业,拓扑社是IT桔子旗下专注企业级服务的垂直媒体,关注和报导To B市场的新产品、新趋势、新观点,传递企业服务价值。
微软加速器·北京11期的入选企业的重点是人工智能与产业落地应用结合,以人工智能底层技术平台作为创业方向。这些创新企业都是企业服务类创业公司,覆盖大数据、人工智能、物联网、区块链等技术,并在医疗、政府、零售、建筑等行业中获得标杆客户。
微软加速器·北京旨在做资源聚合、生态共享的创新创业平台,致力于为中国成长型创新创业企业提供全方位优质服务。每年在大中华地区进行两期海选,每期选拔15-20家公司,入选的创业公司将入驻4-6个月的国际化办公空间,并得到思想领袖、行业专家及技术专家组成的导师团的扶植与指导;每个入选团队还将得到价值上百万元人民币的微软Azure云服务等多种资源,所有资源均为免费的终生制校友服务。
微软加速器·北京致力于打造微软加速器创新生态体系,汇聚行业领军企业、投资机构、合作伙伴、创业园区、政府及政策支持等多方力量,整合微软内部业务、市场、研发等强大的全球资源,构建全方位的战略合作关系联盟,共同为创业企业进行市场推广、销售和客户对接支持,促进微软协同创新生态发展。